Puma Katari & Big Data

700 mil datos analizando la calidad del servicio

rafael lopez v.

Octubre 2017





Objetivo: Evaluar y mejorar el servicio de los Puma Katari con datos generados por los propios buses






Sobre el proyecto

Se eligió 1 de las 6 rutas



Se eligió una dirección de la ruta



Se supuso que los GPS de los buses generan datos

Se tomaron los tiempos 5 veces (en condiciones normales)

Estas condiciones pueden alterarse por:

  • Paradas con mas gente que otras

  • Tramos mas lentos que otros: tráfico vehicular

  • Marchas y bloqueos en el centro de la ciudad

  • Horas que afectan los tiempos en los tramos (v.g. medio día vs. media noche)

  • Los intervalos de partida se extrajeron de aquí





Con todas estas características se simularon casi 700 mil datos en R





La simulación generó







Resultados


- 97% de los viajes tardan entre 52 y 60 minutos desde la primera hasta la última parada
- Sin embargo, a veces los buses tardan hasta 175 minutos (casi 3 horas)
- Veamos que días y a que horas se producen los mayores atrasos


- Los 4 picos muestran atrasos por protestas sociales
- Hay una tendencia en los picos pequeños: mayores atrasos alrededor de las 11 y 12 am y 8pm
- Pero.. en que tramos se producen los atrasos?


- Los tramos entre las paradas 1 y 4 son los menos regulares. Los atrasos se generan allí
- Veamos en detalle estos tramos, sabiendo que son los que generan los atrasos





Para ver el atraso por tramos y horas utilicé “boxplots”. Ver la siguiente explicación


- El tramo 1-2 sufre los mayores atrasos entre las 7 y 9 am, entre las 12 y 14 pm y 19-20 pm - El tramo 2-3 sufre los mayores atrasos antre las 12 y 2 pm - El tramo 3-4 sufre los mayores atrasos antre las 7 y 8 de la mañana - Veamos el mimso gráfico pero sin valores extremos





Ahora veamos los tiempos en los tramos no conflictivos

los mayores atrasos no se dan en estos tramos





Resumen hasta aquí





Los atrasos se dan por conflcitos sociales y también por demoras en horas picos en los tramos 1 al 4 (centro) particularmente

El objetivo es pasar del modelo azul al rojo: tiempo total del recorrido





Se sabe sobre que tramos y horas se debe actuar. Después, los datos nos dirán si las reformas son efectiuvas o no





Propuesta

No se necesita mucho



Los datos de la simulación pesan 14 megabytes o 2% de un DVD



Los datos para todas las rutas por año pesarían 19 gigabytes o 4 DVD`s

rafa lópez v